На главную страницу второго семестра

Глобальное и локальное выравнивания аминокислотных последовательностей

Матрицы переходов

Глобальное выравнивание

  • Выравнивание строилось для последовательности из первых четырёх аминокислот белка SYM_ECOLI (TQVA) и последовательности, полученной из первой путём замены двух аминокислот и вставкой ещё одной дополнительной (TMQKG);
  • Использовались следующие параметры:
    • Вес совпадения — 2;
    • Вес замены — -1;
    • Штраф за делецию — -2;
  • Оптимальное выравнивание:
     
    T-QVA
    | |   
    TMQKG   
    

Локальное выравнивание

  • Выравнивание строилось для последовательности из первых девяти аминокислот белка SYM_ECOLI (TQVAKKILV) и последовательности из 2,3,7,8,9 аминокислот белка SYM_ECOLI (QVILV);
  • При построении использовались следующие параметры:
    • Вес совпадения — 2;
    • Вес замены — -1;
    • Штраф за делецию -2;

Влияние параметров на глобальное выравнивание

Здесь приводятся глобальные выравнивания белка SYM_ECOLI и аминокислотной последовательности, построенной из двух участков последовательности самого белка. Они строились с помощью программы NEEDLE из программного пакета EMBOSS . Эта программа использует аффинную систему штрафов, то есть штрафы за открытие гэпа (делеции) и за его продолжение разные.

В приведённом ниже выравнивании эти штрафы равны. То есть фактически мы не используем возможности аффинной системы штрафов. Получаем несколько небольших делеций.

Штраф за открытие гэпа (делеции) — 1

Штраф за продолжение гэпа (делеции) — 1

SYM_ECOLI          1 TQVAKKILVTCALPYANGSIHLGHMLEHIQADVWVRYQRMRGHEVNFICA     50
                                                                       
NEWSEQ             1                                                         0

SYM_ECOLI         51 DDAHGTPIMLKAQQLGITPEQMIGEMSQEHQTDFAGFNISYDNYHSTHSE    100
                                                                       
NEWSEQ             1                                                         0

SYM_ECOLI        101 ENRQLSELIYSRLKENGFIKNRTISQLYDPEKGMFLPDRFVKGTCPKCKS    150
                                                                       
NEWSEQ             1                                                         0

SYM_ECOLI        151 PDQYGDNCEVCGATYSPTELIEPKSVVSGATPVMRDSEHFFFDLPSFSEM    200
                                                                   ||||
NEWSEQ             1                                               FSEM      4

SYM_ECOLI        201 LQAWTRSGALQEQVANKMQEWFESGLQQWDISRDAPYFGFEIPNAPGKYF    250
                     ||||||| .|.|: |    |.|   |                        
NEWSEQ             5 LQAWTRS-KLTER-A----EAF---L                             21

SYM_ECOLI        251 YVWLDAPIGYMGSFKNLCDKRGDSVSFDEYWKKDSTAELYHFIGKDIVYF    300
                                                                       
NEWSEQ            22                                                        21

SYM_ECOLI        301 HSLFWPAMLEGSNFRKPSNLFVHGYVTVNGAKMSKSRGTFIKASTWLNHF    350
                                                                       
NEWSEQ            22                                                        21

SYM_ECOLI        351 DADSLRYYYTAKLSSRIDDIDLNLEDFVQRVNADIVNKVVNLASRNAGFI    400
                                                                       
NEWSEQ            22                                                        21

SYM_ECOLI        401 NKRFDGVLASELADPQLYKTFTDAAEVIGEAWESREFGKAVREIMALADL    450
                                                                       
NEWSEQ            22                                                        21

SYM_ECOLI        451 ANRYVDEQAPWVVAKQEGRDADLQAICSMGINLFRVLMTYLKPVLPKLTE    500
                                                                       
NEWSEQ            22                                                        21

SYM_ECOLI        501 RAEAFLNTELTWDGIQQPLLGHKVNPFKALYNRIDMRQVEALVEASKEEV    550
                                                                       
NEWSEQ            22                                                        21

SYM_ECOLI        551 KAAAAPVTGPLADDPIQETITFDDFAKVDLRVALIENAEFVEGSDKLLRL    600
                                                                       
NEWSEQ            22                                                        21

SYM_ECOLI        601 TLDLGGEKRNVFSGIRSAYPDPQALIGRHTIMVANLAPRKMRFGISEGMV    650
                                                                       
NEWSEQ            22                                                        21

SYM_ECOLI        651 MAAGPGGKDIFLLSPDAGAKPGHQVK    676
                                               
NEWSEQ            22                                21
          
В этом выравнивании цена за открытие гэпа (делеции) выше, поэтому образование нескольких делеций невыгодно, и образуется одна большая.

SYM_ECOLI          1 TQVAKKILVTCALPYANGSIHLGHMLEHIQADVWVRYQRMRGHEVNFICA     50
                                                                       
NEWSEQ             1                                                         0

SYM_ECOLI         51 DDAHGTPIMLKAQQLGITPEQMIGEMSQEHQTDFAGFNISYDNYHSTHSE    100
                                                                       
NEWSEQ             1                                                         0

SYM_ECOLI        101 ENRQLSELIYSRLKENGFIKNRTISQLYDPEKGMFLPDRFVKGTCPKCKS    150
                                                                       
NEWSEQ             1                                                         0

SYM_ECOLI        151 PDQYGDNCEVCGATYSPTELIEPKSVVSGATPVMRDSEHFFFDLPSFSEM    200
                                                                   ||||
NEWSEQ             1                                               FSEM      4

SYM_ECOLI        201 LQAWTRSGALQEQVANKMQEWFESGLQQWDISRDAPYFGFEIPNAPGKYF    250
                     |||||||         |:.|..|:.|                        
NEWSEQ             5 LQAWTRS---------KLTERAEAFL                             21

SYM_ECOLI        251 YVWLDAPIGYMGSFKNLCDKRGDSVSFDEYWKKDSTAELYHFIGKDIVYF    300
                                                                       
NEWSEQ            22                                                        21

SYM_ECOLI        301 HSLFWPAMLEGSNFRKPSNLFVHGYVTVNGAKMSKSRGTFIKASTWLNHF    350
                                                                       
NEWSEQ            22                                                        21

SYM_ECOLI        351 DADSLRYYYTAKLSSRIDDIDLNLEDFVQRVNADIVNKVVNLASRNAGFI    400
                                                                       
NEWSEQ            22                                                        21

SYM_ECOLI        401 NKRFDGVLASELADPQLYKTFTDAAEVIGEAWESREFGKAVREIMALADL    450
                                                                       
NEWSEQ            22                                                        21

SYM_ECOLI        451 ANRYVDEQAPWVVAKQEGRDADLQAICSMGINLFRVLMTYLKPVLPKLTE    500
                                                                       
NEWSEQ            22                                                        21

SYM_ECOLI        501 RAEAFLNTELTWDGIQQPLLGHKVNPFKALYNRIDMRQVEALVEASKEEV    550
                                                                       
NEWSEQ            22                                                        21

SYM_ECOLI        551 KAAAAPVTGPLADDPIQETITFDDFAKVDLRVALIENAEFVEGSDKLLRL    600
                                                                       
NEWSEQ            22                                                        21

SYM_ECOLI        601 TLDLGGEKRNVFSGIRSAYPDPQALIGRHTIMVANLAPRKMRFGISEGMV    650
                                                                       
NEWSEQ            22                                                        21

SYM_ECOLI        651 MAAGPGGKDIFLLSPDAGAKPGHQVK    676
                                               
NEWSEQ            22                                21
          
Штраф за открытие гэпа (делеции) — 5

Штраф за продолжение гэпа (делеции) — 1

Как видно, второй случай также не соответствует произведённым над последовательностью операциям. По-видимому, штраф за продолжение делеции остается слишком высоким, чтобы программа искала участки гомологии, не обращая внимания на количество крупных внутренних гэпов.

Надо также отметить, что при штрафе за открытие гэпа (делеции) 10 результат тот же, что и во втором случае.


© Фадеев Андрей, 2005